deepseekr1

DeepSeek R1深度解析及算力影响几何

Deepseek发布两款具备深度推理能力的大模型R1-Zero和DeepSeek-R1。 R1-Zero的训练,证明了仅通过RL,无SFT,大模型也可以有强大的推理能力。在AIME 2024上,R1-Zero的pass@1指标 从15.6%提升至71.0%,经

deepseek r1 deepseekr1 2025-02-07 04:26  18

国外一博士解释DeepSeek R1背后的逻辑

在2024年,LLM领域看到了越来越多的专业化。除了预培训和微调外,我们还目睹了专业应用的兴起,从破布到代码助手。我希望这一趋势在2025年会加速,更加重视域和应用特定的优化(即“专业”)。

llm deepseek deepseekr1 2025-02-07 17:34  18